&Q 54i xt 


第 64 卷 第 5 期 2020 ££3 H 


Chinay ride BAI 
ChinaXiv 合 作 期 刊 


基于 修正 点 互信 息 的 特征 级 情感 词 极 性 自动 研判 


Wu BXS 
中 山大 学 资讯 管理 学 院 广州 510275 


摘 要 : [目的 /意义 ] 基于 语 料 的 情感 词 发 现 依 语句 上 下 文 推断 情感 词 极 性 ,能 显著 提升 情感 分 析 的 准确 率 ,在 面向 领域 
的 特征 级 情感 分 析 任 务 中 有 重要 应 用 价值 。[ 方 法/ 过程] 对 特征 级 情感 极 性 研判 问题 展开 探讨 ,提出 基于 点 互信 
息 的 “特征 -情感 "对 情感 极 性 自动 判别 算法 ,算法 借助 大 规模 领域 语 料 ,根据 观点 表达 “特征 -情感 "对 与 情感 语 
义 明确 的 种 子 词 的 共 现 关系 ,同时 引入 依存 句法 分 析 语 句 间 的 情感 转折 ,通过 修正 经 典 的 点 互信 息 算法 ,对 上 下 
文 约束 下 的 用 户 观点 表达 进行 讲 贬 预测 。[ 结果 /结论 ] 实验 证 明 ,修正 算 法 的 性 能 显著 优 于 词典 匹配 算法 和 经 
典 的 点 互信 息 情感 识别 算法 ,不 仅 能 够 推断 词典 中 未 纳入 的 观点 表达 的 情感 指向 ,而 且 能 较 准 确 地 推断 “ 语 境 ” 
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中 的 情感 词 极 性 。 在 餐饮 评论 和 数码 产品 评论 两 个 评测 语 料 集 上 ,修正 算法 的 Fl 宏 平 均 指标 分 别 达 到 0.827 和 
0.878。 该 算法 以 领域 相关 的 大 规模 语 料 为 支撑 ,基于 概率 统计 和 句法 分 析 , 因 数据 获取 便利 ,算法 效率 高 ,移植 
性 好 ,具有 普 适 性 ,尤其 适用 于 面向 领域 的 情感 分 析 任 务 。 


QB5| 言 


eb 技术 和 电子 商务 的 飞速 发 展 正极 大 改变 着 人 
们 欧 生 活 , 人 们 不 仅 习 惯 于 在 线 购物 ,而 且 常常 在 平台 
发 表 购 物体 验 ,网 络 上 由 此 产生 了 大 量 的 在 线 评论 。 
用 网 的 在 线 产品 评论 在 商务 领域 被 称 为 产品 的 网 络 口 
碑 3 于 富 含 重要 商业 价值 ,受到 业界 和 学 术 界 的 关注 。 
75 从 在 线 评论 中 提取 有 价值 信息 是 “评论 挖掘 ”的 
重要 内 容 。 评 论 挖掘 针对 蕴含 观点 的 主观 性 文本 , 基 
本 任务 是 判断 用 户 对 产品 各 特征 性 能 所 发 表 评价 的 情 
感 倾向 一 一 正 向 或 负 向 。 这 一 情感 分 析 任 务 面向 产品 
特征 ,情感 词 极 性 往往 与 评价 对 象 有 关 。 如 ,在 手机 评 
论 中 ,对 于 形容 词 “高 ", “性 价 比 -高 "为 正 向 ,“ 能 
-高 "为 负 向 ;在 股票 评论 中 ,“ 通 胀 率 - 高 "为 负 向 ， 
“利率 -高 " 则 为 正 向 。 可见, 某 些 观点 词 的 情感 指向 
会 随 关联 对 象 发 生变 化 ,出 现 所 谓 的 “情感 歧义 ”。 

对 于 特征 级 情感 分 析 , 具有 “情感 歧义 "属性 的 情 
感 词 的 出 现 会 使 得 基于 词典 的 情感 极 性 研判 产生 仿 
差 。 因 为 ,在 情感 词典 中 , 词 项 的 极 性 均 被 固化 ;但 实 


际 应 用 中 ,诸多 具有 情感 色彩 的 词 项 ,其 极 性 会 随 “ 语 
境 "发 生变 化 (“ 语 境 "在 本 文 主要 指 情感 词 所 在 语句 
的 上 下 文 语义 约束 ,如 修饰 对 象 ) ,如 “大 ,小 ,高 , 低 ” 
等 ,对 于 这 类 词 ,通用 词典 通常 不 收纳 ,或 将 其 再 细 分 ， 
如 “大 连理 工大 学 中 文 情感 词汇 本 体 库 ”… 的 情感 词 
DN SE ,Wz , SE Wz DITE, re pE" 4 26, SEV up HL S 
情感 极 性 ,中 性 词 和 褒贬 两 性 词 的 情感 极 性 则 与 “ 语 
Ni" 相关 。 对 于 特征 级 情感 分 析 ,能 够 准确 判断 随 * 语 
BE” 变化 的 词 的 情感 极 性 对 确保 精准 度 .提升 分 析 质 量 
有 重要 意义 。 许 多 研究 将 其 归 为 面向 领域 的 情感 词典 
构建 问题 , 且 普 遍 认 为 ,情感 词 项 有 领域 依赖 性 ,基于 
领域 语 料 发 掘 情感 词 并 对 其 极 性 进行 研判 是 提升 情感 
分 析 精 度 的 有 效 手 段 。 研 究 者 们 已 注意 到 词 项 的 情感 
歧义 问题 ,但 领域 情感 词典 构建 针对 的 仍 是 孤立 情感 
词 , 收 义 问题 并 未 得 到 根本 解决。 

本 研究 关注 情感 词 极 性 的 收 义 问题 ,认为 要 受 善 
解决 衰 贬 两 性 或 中 性 词 的 情感 指向 不 定 问 题 , 需 将 情 
感 词 与 关联 对 象 (特征 ) 作 为 整体 考虑 ,同时 将 分 析 对 
象 所 在 语句 的 上 下 文 约束 关系 纳入 分 析 模 型 。 因 此 ， 
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容 . 基 于 修正 点 互信 息 的 特征 级 情感 词 极 性 自动 研判 [J]. 图 书 情报 工作 ,2020 ,64(5) 1114 - 123. 


本 研究 强调 “特征 - 情感 "对 的 情感 极 性 研判 ,研究 利 
用 大 规模 领域 语 料 ,并 借鉴 点 互信 息 算 法 ,通过 引入 依 
存 句 法 捕获 情感 表达 的 上 下 文 约束 来 对 “特征 -人 情 
感 ” 的 极 性 进行 推断 。 算 法 选择 非 监 督 策略 ,以 减少 人 
工 介 入 ;而 算法 基于 领域 语 料 , 以 使 其 具有 更 好 的 灵活 
性 。 


2 相关 研究 


断 其 情感 指向 。A. Balahur 等 基于 3 种 策略 的 多 数 
投票 结果 来 对 “特征 - 情感 "对 的 极 性 进行 研判 ,3 种 
策略 分 别 是 基于 上 下 文 的 有 监督 学 习 、 基 于 网 络 查询 

WA H. H. Lek 和 D. C. 
C. Poo "针对 “特征 - pk" XT, P BEIT REN RE 
类 ,再 利用 WordNet 对 情感 词 和 特征 词 的 近义词 进行 
合并 ,最 终 采 用 分 类 法 对 情感 词 指 派 极 性 ;Y. Q. Xia 
等 '” 则 对 情感 词 所 在 语句 的 内 部 要 素 进 行 了 细致 分 


2.1 面向 评论 的 特征 级 情感 分 析 
面向 评论 的 特征 级 情感 分 析 为 细 粒 度 情感 分 析 。 
如 一 则 手机 评论 “这 款 手机 的 散热 太 差 了 , 玩 一 会 儿 就 
汤 手 ,像素 也 就 一 般 吧 , 但 是 整体 运行 速度 还 不 错 ,在 
这 个 价位 的 手机 中 还 算 值得 推荐 " 。 评 论 中 ,用 户 对 该 
徒 桃 的 性 能 进行 了 多 方 点 评 ,特征 级 情感 分 析 则 需 从 
Do.cc KARE - 一 般 ”“ 运 行 速 度 -不 
错 2 等 一 组 用 户 观点 ,并 准确 判断 其 情感 指向 。 
早期 研究 中 ,M. Q. Hu 等 和 B. Liu 45 3E JH 
联 纲 则 挖掘 产 品 特征 词 , 并 通过 WordNet 扩充 形容 词 
确定 用 户 观点 (情感 词 ) ,进而 预测 用 户 对 产品 性 能 的 
情感 倾向 ; A. M. Popescu 等 ”通过 引入 语法 规则 ,更 好 
der SE - 情感 "对 的 识别 。 对 于 特征 级 情感 
AKI. REA BOER E - 情感 "对 , 另 一 关键 问题 
是 之 感 值 计算 ,一 般 情况 下 , 词 粒度 的 情感 极 人 性 判断 和 
计 仁 都 需 借助 情感 词典 。 中 文 领域 , HowNet 和 大 连理 
文 情 感 词汇 本 体 症 均 是 被 广泛 采用 的 通用 情感 词 
典 e2 但 通用 词典 多 为 人 工 生成 , 词 项 覆盖 率 有 限 ,实际 
应 则 中 ,需要 根据 应 用 领域 拓展 词 表 ,构建 领域 情感 词 
OREWA rh, P. D. Turney 等 中 提出 利用 情感 
种 子 词 计算 词 项 间 的 互信 息 用 于 推测 拓展 词 的 襄 贬 倾 


析 , 根 据 句 中 的 修饰 副词 及 明确 极 性 的 情感 词 ,运用 贝 
叶 斯 分 类 法 对 有 特征 依赖 性 的 情感 词 的 极 性 进行 判 


男 一 方面 ,特征 级 的 情感 分 析 还 强调 情感 计算 的 
精细 化 ,提出 用 户 观点 的 量化 不 仅 要 准确 辨 明 情 感 极 
还 应 考虑 其 修饰 成 分 。 例 如 "尤其 贵 “ 不 太 友好 ” 

算 满意 ” 等。 这 些 观点 表述 中 ,修饰 成 分 加 强 ` 减 
trou 情感 词 极 性 , 若 要 提升 分 析 的 精准 度 , 修 
饰 副词 的 程度 影响 不 可 忽略 。 如 C. Whitelaw 等 ” 结 
合 WordNet 用 半自动 方法 的 同时 构建 了 情感 词 词典 及 
修饰 词 词典 ,根据 修饰 词 的 属性 值 来 计算 观点 表达 的 
情感 值 ;S. L. Huang 等 "依据 词性 匹配 模式 定位 * 特 
征 — 情感 "对 ,并 通过 引入 副词 及 否定 词 来 确定 情感 词 
极 性 ,量化 用 户 观 点 ; 史 伟 等 深入 探讨 了 副词 的 作 
用 ,采用 加 权 原 则 ,达到 细 化 情感 分 值 的 目的 ; 笔者 
09 也 曾 利用 Stanford. Parser 语法 工具 获得 语句 中 副词 
与 情感 词 的 修饰 关系 ,继而 通过 设 定 修 饰 词 与 情感 词 
的 组 配 模式 来 确定 观点 表达 的 极 性 ,实现 细 粒 度 的 情 
感 分 析 。 

由 此 可 见 , 特 征 级 情感 分 析 强 调 的 是 对 用 户 褒 贬 
观点 的 准确 研判 。 用 户 观点 比 单纯 的 情感 词 具有 更 丰 


向 ,点 互信 息 (Point Mutual Information , PMI ) 法 在 情感 
分 析 领 域 被 广泛 采纳 ,情感 词典 在 情感 分 析 领 域 发 挥 
了 重要 作用 。 

但 随 着 研究 的 深入 ,有 学 者 “注意 到 不 同 释义 
下 情感 词 可 能 有 不 同 的 情感 指向 ,如 “长 ” E Hi 2 
续航 时 间 和 聚焦 时 间 上 的 情感 极 性 是 相反 的 " 
在 针对 “性 价 比 ”" 和 “物价 ”的 评价 中 ,情感 极 性 也 出 现 
了 歧义 ;学 者 X. Ding 等 "特别 指出 对 于 特征 级 情感 分 
析 , 情 感 词 极 性 要 与 所 修饰 的 特征 词 形成 对 应 ,才能 确 
保 分 析 精 度 。 随 后 ,许多 研究 开始 关注 面向 特征 的 情 
感 词 极 性 的 准确 判定 问题 。Y. F. Wu 等 “提出 基于 常 
识 的 情感 词 消 歧 方 法 ， 针对 14 个 中 文 高 频 特征 依赖 形 
容 词 ,如 “大 小 多 少 高 低 ”, 依 据 对 特征 词 和 修饰 形容 
词 的 副词 (“有 点 “那么 ”) 的 判断 ,使 用 固定 模式 判 


富 的 表达 形式 与 内 涵 。 特 征 级 情感 分 析 不 仅 要 对 “ 特 
征 -情感 "对 统一 考虑 ,还 需 对 情感 表述 所 在 语句 的 语 
法 结构 和 语义 关系 进行 分 析 。 
2.2 情感 词 极 性 研判 与 情感 词典 构建 

本 研究 主要 对 “特征 — 情感 "对 的 极 性 判断 问题 进 
行 探究 ,主要 任务 是 辨识 情感 词 ,并 根据 修饰 对 象 判 断 
情感 词 指向 。 这 一 工作 亦 是 构建 情感 词典 的 核心 任务 。 
2.2.1 基于 词典 的 情感 词 发 现 与 极 性 判断 

词典 拓展 是 自动 生成 情感 词典 的 重要 方法 ,该 方 
法 利用 词典 定义 的 词 间 关联 ,基本 思路 是 : 先 确定 一 组 
极 性 明确 的 情感 种 子 词 CORB) ,再 在 词典 中 搜索 种 
子 词 的 同 / 反 义 词 , 谓 之 拓展 词 ,根据 拓展 词 与 种 子 词 
的 同 / 反 义 关系 赋予 拓展 词 极 性 ,纳入 情感 种 子 集 ,这 
一 过 程 循环 迭代 ,直至 情感 词 集 收敛 。M. Q. Hu 和 B. 
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Liu 采用 这 一 方法 基于 WordNet 生成 了 广 被 采纳 的 
Opinion Lexicon ^. ; A. Esuli 和 F. Sebastian AA, fl 
感 指向 一 致 的 词 项 极 可 能 有 相似 的 注释 信息 , 对 
WordNet 的 注释 进行 分 类 能 够 帮助 判断 词 项 极 性 ;J. 
Kamps $U! 先 建立 基于 WordNet 的 同义词 网 络 ,然后 
借助 网 络 结构 推断 候选 词 的 情感 倾向 ,在 同义词 网 络 
中 ,候选 词 与 “good” 或 “bad” 间 的 距离 决定 其 鹿 几 性 
质 ;A. Hassan 和 D. Radev!” 则 采用 了 先进 的 马尔 科 夫 
随机 游 走 算法 ,基于 WordNet 近 义 和 上 位 关系 生成 词 
图 ,通过 计算 候选 词 跳 转 到 褒贬 词 集 的 平均 步 数 ,指派 
其 情感 指向 。 整 体 看 来 ,这 类 研究 通常 将 候选 词 作为 
独立 单元 ,通过 计算 其 与 情感 语义 明确 的 种 子 词 的 关 
联 度 推断 其 窒 贬 性质 。 基 于 词典 研判 词 项 极 性 往往 受 
词典 定义 制约 , 词 项 极 性 随 修饰 对 象 及 语句 上 下 文 会 
发 从 变化 的 问题 不 能 得 以 解决 ,词典 方法 对 情感 语义 
明确 的 词 项 的 识别 效果 较 好 ,对 衰 贬 兼容 或 中 性 词 的 
情感 推断 则 可 能 出 现 偏差。 

wh 基于 领域 语 料 的 情感 词 挖掘 与 极 性 判断 

基于 词典 拓展 获得 的 情感 词 极 性 受制 于 词典 ,而 


X | 


谱 多 研究 面向 的 是 特定 领域 的 情感 分 析 任务 ,利用 领 
域 适 料 进行 情感 词 挖 气 更 具 实用 价值 。 这 类 方法 从 领 
域 请 料 中 发 据 情 感 词 ,通过 构建 领域 情感 词典 提升 情 
RAWE. M N. Oliveira 等 "标注 了 一 个 基于 股票 
推 物 的 语料库 ,借助 语料库 计算 候选 词 与 “ 牛 /熊市 ” 
的 美 联 度 ,从 而 发 现 股票 领域 特有 的 情感 词 ,该 方法 需 
事 沸 对 语 料 进 行 标注 ;S. Deng 等 ” 则 提出 通过 无 标注 
数据 构建 领域 词典 ,他 们 先 对 情感 候选 词 做 细致 第 选 ， 
再 入 用 点 互信 息 推 断 候选 词 的 极 性 ,该 研究 因 引 入 了 
大 规模 无 标注 领域 语 料 , 建 模 效率 高 ,提升 了 词典 在 执 
行 领域 情感 分 析 任 务 时 的 实效 ; 痢 亚 辉 “的 领域 情感 
词典 构建 分 两 个 阶段 ,首先 利用 词 的 点 互信 息 和 上 下 
文 约束 关系 建立 词 矩 阵 ,在 矩阵 上 运用 标签 传播 算法 
拓展 种 子 构造 基本 情感 词典 ,再 根据 语 料 中 出 现 的 情 
感 冲突 频率 来 判断 领域 关联 情感 词 的 极 性 ; K. Labille 
等 ”基于 概率 论 和 信息 论 , 借 助 评论 语 料 构 建 了 15 
个 领域 的 情感 词典 ,实际 应 用 中 ,表现 优良 。 致 力 于 领 
域 情感 词典 构建 的 研究 均 认为 领域 词典 具有 针对 性 ， 
能 解决 情感 歧义 问题 , 比 通用 情感 词典 更 有 效 。 深 度 
学 习 方 法 也 被 用 于 领域 情感 词典 构建 :Y. Li 等 55 提出 
在 词 向 量 训练 过 程 中 加 入 更 多 的 先 验 知识 优化 词 嵌入 
矩阵 ,使 其 能 够 适应 特定 领域 的 情感 分 析 任务 ; 林 江 
豪 “ 等 采用 基于 大 规模 语 料 构建 W2V(Word2Vector) 
的 预 训练 词 向 量 对 词 项 进行 深度 表示 ,结合 情感 词典 ， 


得 到 词 的 情感 向 量 表示 ,赋予 词 项 更 丰富 的 情感 语义 。 

总 体 看 来 ,基于 语 料 的 方法 对 具有 领域 依赖 性 的 
情感 词 研判 比较 适用 , 非 标注 语 料 在 实际 应 用 也 更 具 
可 行 性 。 但 单纯 生成 领域 词典 ,还 是 不 能 改变 某 些 词 
项 ( 完 贬 双 性 或 中 性 词 ) 的 “ 语 境 "依赖 性 。 本 研究 所 
指 “ 语 境 " 特 指 情 感 词 所 在 语句 的 上 下 文 约束 ,尤其 是 
情感 词 修饰 的 特征 词 。 对 于 这 类 情感 词 极 性 研判 问 
题 ,本 研究 认为 ,只 有 将 情感 词 所 在 语句 的 上 下 文 及 修 
饰 对 象 纳入 模型 , 才 可 能 对 其 情感 指向 做 出 准确 推断 。 
为 此 ,与 构建 领域 词典 的 做 法 不 同 ,研究 将 “特征 - 情 
感 " 对 作为 情感 识别 对 象 ,就 整个 “观点 表达 ”进行 极 
性 推断 ,并 对 点 互信 息 算法 进行 修正 ,将 基于 依存 句法 
分 析 获 得 的 “情感 转折 ”状态 纳入 计算 模型 。 本 研究 
提出 的 方案 因 兼 顾 了 修饰 对 象 及 语句 的 上 下 文 约束 ， 
能 处 理 情感 收 义 问题 ,并 使 分 析 精 度 得 以 提升 ; 男 则 ， 
本 研究 采用 基于 语 料 的 情感 词 挖掘 方法 ,不 受 词 典 约 
束 ,在 领域 语 料 充沛 的 前 提 下 ,该 方法 能 够 非常 方便 地 
迁移 至 不 同 场景 。 大 数据 环境 下 ,获取 无 标注 领域 语 
料 成 本 低 且 十 分 便利 ,因而 本 方法 具有 较 好 的 普 适 性 。 


3 ”基于 点 互信 息 的 “特征 -情感 ”对 极 性 
研判 


3.1 互信 息 及 基于 点 互信 息 的 情感 词 极 性 判断 
互信 息 是 信息 论 中 的 概念 ,在 文本 挖掘 领域 被 用 
于 计算 词汇 间 的 相关 度 。 点 互信 息 计算 基于 共 现 概 
率 , 语 料 充足 的 前 提 下 , 词 项 共 现 率 越 高 ,相关 性 越 大 。 
若 以 wl 与 w2 表示 两 词 项 ,其 互信 息 计算 公式 如 下 : 


P(wl ,w2) 
| 


其 中 ,PCwl) 与 P(w2 ) 为 词 项 独立 出 现 的 概率 , 
(wl,w2) 为 二 者 共 现 概率 。P. D. Turney 和 M. L. Little- 
ma ”将 互信 息 引 入 情感 分 析 , 称 为 情感 点 互信 息 计算 
( Semantic Orientation Pointwise Mutual Information, SO- 
PMI) 。 其 依据 是 :情感 倾向 相同 的 词 项 常 频繁 出 现 ， 
如 “开心 -喜悦 “痛苦 -悲伤 ” ,情感 倾向 相反 的 词 则 
不 然 。 这 使 得 “开心 ”与 “喜悦 ”的 互信 息 较 高 ;与 ^ 痛 
昔 ” 的 互信 息 则 较 低 。 因 此 ,对 于 一 个 待 测 情 感 词 项 
w, 将 其 和 褒 义 种 子 词 集 Pos_set 的 互信 息 与 其 和 贬义 
种 子 词 集 Neg set 的 互信 息 进 行 比较 ,可 推测 w 的 情感 
指向 ,有 公式 (2): 

SO_PMI(w) = È perse PM(w,w_P) - X 
pis PMI(w,w_N) (2) 

zi SO-PMI(w) >0,w 的 情感 极 性 偏 正 ; SO-PMI 


PMI(wl,w2 ) -los[ 
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(w) < 0;w 的 情感 极 性 偏 负 。 可 见 , 经 典 的 点 互信 息 
情感 计算 与 情感 种 子 集 Pos_set 和 Neg. set 关联 密切 ， 
且 情 感 依存 关系 设 定 相对 简单 。 但 真实 语言 环境 中 ， 
情况 往往 比较 复杂 。 极 性 相反 的 词 也 时 常 同时 出 现 ， 
如 “ 痛 并 快乐 ”“ 乐 极 生 翡 " 等 。 对 于 这 类 情况 ,运用 单 
纯 的 SO_PMI 计算 方法 肯定 会 产生 偏差 。 
另 则 ,本 研究 以 “特征 - 情感 "为 极 性 研判 对 象 ， 
非 纯粹 情感 词 ,基于 共 现 关 系 的 情感 一 致 性 会 因 句 式 
结构 产生 变化 。 如 “这 家 餐厅 的 价钱 合理 ,但 是 服务 
太 差 了 。” 该 评论 从 两 方面 评价 一 家 餐厅 ,“ 价 钱 - 合 
HW" pu, "HAS - 差 "为 贬 。 误 贬 情感 状态 共 现 , 若 以 
情感 极 性 一 致 为 准则 计算 PMI, 则 无 论 是 通过 “服务 - 
太 差 "去 推断 “价钱 - 合理 ”的 极 性 ,还 是 基于 “价钱 - 
命理 "去 推测 “服务 - 太 差 "的 极 性 ,都 可 能 出 现 错 判 。 
AVE SR, ELA IRL, E I “特征 - 情感 "的 情 
感 指向 因 语 句 中 存在 转折 词 “但 "发 生 了 道 转 。 类 似 
加 博 感 共 现 的 情况 ,语言 中 十 分 普遍 ,各 种 转折 关系 
导致 主体 词 尽管 一 致 ,但 语义 差别 甚 远 ,如 “ 价 


格 合理 ,但 是 服务 太 差 “价格 合理 ,服务 也 不 差 。” 
“价格 不 合理 ,服务 也 很 差 。 “价格 不 合理 ,但 是 服务 
不 差 。”, 这 4 句 话 在 语义 和 情感 上 存在 明显 区 别 , 在 只 
考虑 共 现 的 PMI 计算 中 ,4 句 话 里 都 有 “价格 - 合理 ” 
和 “服务 - 差 ” 的 出 现 ,使 得 这 4 句 话 的 PMI 计算 等 
价 , 但 显然 ,如 此 处 理 将 导致 错 判 。 本 研究 认为 ,对 “ 特 
征 -情感 ”的 极 性 进行 推断 ,在 共 现 基础 上 ,还 应 将 语 
名 表达 中 的 情感 反 向 及 转折 关系 纳入 分 析 中 ,利用 名 
法 依存 分 析 可 更 准确 地 提取 词 项 间 的 情感 关系 ,减少 
错 判 几 率 ,提升 算法 精度 。 
3.2 基于 点 互信 息 的 “特征 - 情感” 极 性 研判 修正 算法 
本 研究 对 P. D. TURNEY “提出 的 情感 互信 息 计 
算 方 法 进行 了 改进 ,针对 “特征 - 情感 "的 情感 倾向 性 
判断 , 采用 依存 句法 分 析 ,通过 引入 反 转 /转折 关系 来 
修正 “特征 - 情感 "与 种 子 情 感 词 集 的 情感 一 致 性 ,以 
减少 识别 偏 误 。 人 研究 先 通过 观察 ,对 语 料 中 情感 转折 
现象 进行 分 析 , 示 例如 表 1 所 示 : 


表 1 否定 /转折 词 对 语句 情感 语义 的 影响 ( 示例 ) 


- 示例 Hid GEW 。 ”是 否 转折 极 性 关系 极 性 判断 
pe MA EM E 但 是 B 是 情感 极 性 不 一 到 服务 - 差 : 反 向 价格 - 合理 : 正 向 
CELLULE IS - 不 是 情感 极 性 不 一 到 服务 - 差 : 反 向 价格 -合理 : 正 向 
GN 价格 不 合理 ,服务 也 很 差 - - 5 情感 极 性 一 致 服务 - 差 : 反 向 价格 - 不 合理 : 反 向 
me 价格 不 合理 ,但 是 服务 不 关 但 是 不 5 情感 极 性 一 致 服务 - 差 : 反 向 价格 - 不 合理 : 反 向 


Se : 设 “ 差 "为 负 向 情感 种 子 , “价格 -合理 ”,“ 价 格 - 不 合理 "为 待 测 特征 情感 组 配 


(Use 1 中 ,“ 但 是 "和 “不 " 均 表示 发 生 了 情感 转折 ， 
共 静 窗口 内 , 反 转 词 为 单数 时 “特征 - 情感 "的 极 性 
与 天 子 情感 词 极 性 不 一 致 ,发 生 了 情感 反 转 。 因 此 , 借 
由 “服务 - 差 "与 价格 -合理 "的 共 现 关系 正确 推断 
“价格 -合理 "的 极 性 应 根据 反 转 情况 修正 “价格 - 合 


输出 :<f,o > 的 情感 极 性 
算法 描述 : 
Stepl : 对 <f,o > e Corpus 初始 化 , 即 PMI pẹ ( <f,o >) -0, 
PMI <f,0>)=0; 
Step2 ; 对 语 料 中 的 原始 语句 进行 切 分 , 设 定 共 现 窗口 为 切 分 后 的 
短 句 , 短 名 中 包含 <f,o > 和 某 种 子 情感 词 w; 


理 ” 与 完 贬 种 子 集 的 互信 息 计算 。 算 法 改进 的 基本 思 
路 为 :中 将 “特征 -情感 "引入 SO. PME 计算 , 设 共 现 窗 
口 为 邻接 子 句 ;@ 构 建 转折 /和 否定 词典 ,引入 转折 /否定 
词 与 待 判 "特征 — 情感 "及 种 子 词 的 依存 关系 ,分 析 情 
感 语 义 转折 现象 ;@) 在 计算 “特征 - TRU 55 SEXT RET 
词 集 的 互信 息 时 ,基于 共 现 及 情感 转折 状态 ,修正 “ 特 
征 -情感 ”与 种 子 词 的 情感 关系 。 算 法 描述 如 下 : 

设 Corpus 为 分 析 语 料 , 采 用 特征 情感 抽取 算法 从 
中 提取 “特征 -情感 ”, 记 为 <f,o > ; <f,o > 与 正 / 负 
面 情感 的 关联 度 分 别 表示 为 PME, ( <f,o > ) ,PMI,, 
( <f,o > ) ;Pos_set 和 Neg_set 分 别 对 应 误 贬 情感 种 子 
fd w 为 情感 种 子 词 ,we Neg_set U Pos set 。 
输入 : <f,o > ,Corpus,Pos set,Neg set 


Step3: 引入 否定 /转折 词典 ,采用 依存 句法 分 析 短 句 ,针对 w 判断 
情感 转折 是 否 发 生 ; 

Step4: 对 于 we Pos. set 计算 “PMI”( <f,o > ,w) 值 ; 千 短 句 中 情 
感 未 发 生 转 折 , 有 

PMI,,( <f,0 >) = PMI,,( <f,0>) +PMI( «fo» ,w) 

若 情感 发 生 了 转折 , 则 

PML,,C «fo» ) = PML,,( «f o») € PMI( «fo» ,w) 

Steph : 对 于 we Neg. set 计算 PMI( «f, o > ,w) 值 ; 若 短 句 中 情感 
未 发 生 转折 ,有 

PML,,( <f,0 >) = PMI,,C <f,0 >) +PMI( <f,0> ,w) 

若 情感 发 生 了 转折 , 则 

PMLI,,( «f, o») = PMI,,( «f o») +PMI( <f,0 > ,w) 

Step6: 计算 <f,o > 的 点 互信 息 , 有 

SO PMI ( «f,o») = PMI,, («fo») - PMLCf, o) 
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zr SOpy( «f,o > ) >0, 表 明 «f,o > 与 正面 情感 
更 紧密 ,可 能 表达 正面 情感 ;反之 可 能 表达 的 是 负面 情 
Ja 


[E 
NO 


需 特别 说 明 的 是 ,算法 第 2 步 ( 共 现 窗口 提取 ) , 切 
分 短 句 采 用 的 是 哈工大 语言 技术 平台 提供 的 Sentenc- 
eSplit 分 名 接口 ,该 功能 根据 分 号 \ 叹 号 、 句 号 等 分 隔 符 
对 长 句 进 行 切 分 ,因此 短 句 中 仍 可 能 包含 子 句 , 子 句 间 
以 逗号 分 隔 。 本 研究 将 短 句 为 窗口 单位 ,在 短 句 上 进 
行 依存 句法 分 析 。 另 则 ,算法 第 3 步 , 借 由 依存 关系 判 
断 情感 转折 。 如 短 句 “价格 合理 ,但 是 服务 很 差 。” 这 
句 话 的 依存 分 析 结 果 中 , “但 是 ”与 “ 差 具有 直接 依存 
关系 ,于 是 将 “但 是 ”这 一 转折 的 发 生 累 计 在 “ 差 ” 这 一 


数据 采集 与 顶 处 理 


; [T eges 7 
Co [| | 采信 数据 | | Brent 
© (sa ws» p | 组 提取 | = | 


领域 数据 外 


负 向 情感 词 上 。 因 此 ,窗口 内 “价格 -合理 "对 于 “ 差 ” 


发 生 的 转折 次 数 为 单数 (1) ,情感 语义 发 生 反 转 ,“ 价 
格 -合理 "对 应 正 向 情感。 

利用 上 述 算法 可 直接 通过 分 析 语 料 推断 “特征 - 
情感 ”的 情感 指向 。“ 特 征 - 情感 "为 统一 体 , 受 共 现 
窗口 内 上 下 文 约束 的 影响 ,引入 依存 句法 关系 可 增强 
判断 ,理论 上 可 提升 识别 准确 率 。 
4 实验 与 分 析 
41 实验 设计 及 流程 

研究 的 实验 流程 见 图 1, 分 4 部 分 :数据 采集 与 预 
处 理 . 种 子 情感 词典 及 转折 /否定 词典 构建 (资源 奸 
设 ) .基于 改进 互信 息 的 “特征 - 情感 "情感 极 性 自动 


判定 。 


资源 建设 


© 基于 PMI 的 情感 极 性 判断 


评测 实验 


=u 1 实验 设计 与 流程 


» 


HE 


过 数 据 采集 与 预 处 理 模块 , 因 需 检测 算法 的 领域 适 
用 和 狂 , 本 研究 选择 餐饮 与 数码 产品 两 个 领域 的 评论 数 
据 海 分 析 语 料 ,主要 针对 评论 内 容 ,对 原始 数据 进行 清 
尝 0 和 采用 自然 语言 天 处 理 技术 进行 分 名 ,分词 运用 依 
存 关 系 分 析 提取 评论 内 容 中 的 “特征 - 情感 "。 在 资 
源 建设 模块 ,利用 4 个 外 部 词典 构建 种 子 情感 词 集 , 人 
工 建立 转折 /否定 词 词典 ; 且 以 外 包 标注 方式 获得 一 份 
评测 语 料 集 。 主 体 实验 采用 3.2 中 提出 的 优化 算法 对 
“特征 - 情感 "进行 情感 倾向 预测 ,并 以 经 典 的 SO_ 
PMI 和 基于 词典 的 情感 匹配 法 为 参照 ,在 评测 语 料 集 
上 进行 实验 ,检验 算法 效能 。 
4.2 ”实验 语 料 与 资源 建设 
4.2.1 实验 语 料 

研究 选择 数码 产品 和 餐饮 领域 ,采集 真实 评论 语 
料 进行 分 析 。 餐 饮 评论 源 自 大 众 点 评 网 ,在 网 站 根据 
排名 选取 广州 地 区 粤菜 商家 的 评论 ,编写 疏 虫 性 取 目 
标 商家 的 用 户 评论 内 容 与 评价 星 级 (评论 时 间 跨 度 为 
2004 年 7 月 7 日 至 2017 4E 10 H 31 日 ), 共 400 126 
条 ,其 中 差 评 (评价 星 级 < 3) 23 663 条 ,好 评 ( 评 价 星 


级 >3) 376 463。 数 码 产 品评 论 源 自 京东 商城 ,数据 获 
取 途 径 则 是 厌 由 下 载 他 人 分 享 的 数据 包 ( 京 东 评论 语 
料 : https :// download. csdn. net/download/qq. 30365565/ 
10657579) 获得 ,下 载 数据 为 原始 评论 语 料 ,进一步 对 
语 料 进 行 了 清洗 .去 重 ,过滤 等 一 系列 处 理 , 京 东 数 码 
产品 评论 的 总 量 为 108 919 条 差 评 ,101 905 条 好 评 。 
4.2.2 词典 

本 研究 整合 了 4 个 外 部 词典 生成 通用 情感 词典 ( 
https ://download. csdn. net/ download/ weixin_42018090/ 
10358043) ,分 别 是 知 网 HowNet 正 / 负 面 情感 词语 NT- 
USD 台湾 大 学 情感 词典 ,清华 大 学 李 军 中 文 寄 贬 义 词 
Ji. (TSING) 和 大 连理 工 的 情感 词汇 本 体 。 对 归并 后 的 
词典 进行 整理 , 吻 除 元 余 和 冲突 情感 词 。 人 研究 所 用 的 
种 子 情感 词 集 选 自 归并 的 情感 通用 词典 , 均 为 情感 语 
义 明确 的 情感 词 项 , 共 10 653 个 正面 词 15 888 Afi m 
词 。 

情感 反 转 判断 需 识别 转折 词 和 否定 词 ,为 此 构建 否 
定 /转折 情感 词典 。 否 定 词 比较 明确 ,参考 网 上 资源 (ht- 
tps ://download. csdn. net/download/fkyyly/10650404 ) 本 
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研究 共 汇 总 了 38 个 常用 中 文 否定 词 ,语义 的 转折 往往 
发 生 在 邻接 语句 间 。 一 般 情况 ,前 面 语句 提出 某 事 实 
或 状态 ,后面 的 语句 转 而 述说 与 前 面 语句 相反 的 意思 ， 
后 面 语句 通常 表述 说 话 人 的 真正 意图 。 中 文 转折 词 归 
属 连 词 ,常用 转折 词 数 量 不 大 ,通过 参阅 网 络 资源 ,并 
观察 从 语 料 中 随机 抽取 的 语句 ,本 研究 以 人 工 方式 汇 
RT 15 个 常用 中 文 转折 词 , 如 表 2 Brom: 

表 2 否定 /转折 词典 

否定 词 转折 词 
不 . 没 .否定 .不 能 ,反而 ,并非 ,相反 .无 法 ,不够 ,不 是 、 可是、 但 是 、 虽 
不 曾 . 未 必 不 要 、 未 曾 .全 无 .不 太 . 未 免 . 不 足 , 未 经 ,可 是 .虽说 ,尽管 、 


不 .并 不 .不 意 .不 意味 .不 意味 着 .不 足以 .不 怎么 . 反 过 ”固然 不过、 只 
来 .并 不 一 定 \ 没 有 ,不 会 . 毫 无 、 毫 不 、 并 不 比 、 绝 不 .不 ”是 .虽然 , 却 然 


4.2.3 评测 语 料 

为 验 测算 法 性 能 ,本 研究 专门 构建 了 一 份 评测 语 
TEE ,分 别 从 京东 电子 产品 评论 集 和 大 众 点 评 餐 饮 业 评 
论 集 中 随机 抽取 评论 1 000 条 和 1 600 条 ,以 外 包 形 式 
委托 数据 公司 进行 人 工 标注 。 每 则 评论 要 求 从 中 抽取 
“特征 -情感 "对 ,同时 注 明 "特征 -情感 ”的 情感 指向 
( 正 向 和 反 向 ) ,标注 结果 采用 < 特征 ,情感 ,情感 极 性 
> 三 元 组 形式 保存 。 标 注 完成 后 ,数据 公司 派 专 人 随 
机 抽样 10% 进行 验 测 ,提交 检测 报告 ,准确 率 达 90% 
以 上 为 满足 标注 的 精度 要 求 。 实 际 评测 语 料 随 机 验 测 
的 精度 为 94% 。 此 外 ,为 了 确保 语 料 均衡 ,在 随机 抽 
取 的 前 提 下 好 / 差 评 数量 大 致 相当 。 标 注 示 例如 表 3 


可 ,没什么 .难以 .不 算 而 ,就 是 .除了 、 ii 
但 不 但 所 示 : 
TT meyer OEA 
> 表 3 测试 语 料 标注 示例 
C" Aie ID 评论 内 容 标注 示例 
6013521 使 用 了 一 天 才 来 评价 运行 速度 都 几 快 ,就 是 电池 不 耐用 ,照相 效果 一 般 般 < 运行 速度 , 快 ,1 > < 电池 ,不 耐用 , -1 > 
Cosmos 手机 很 养眼 ,分辨 率 不 行 , 玩 游戏 卡 屏 , 连 接 WIFI 的 时 候 信号 不 好 < 手机 ,养眼 ,1 > < 分 辨 率 ,不 行 , -1 > < 玩 游 戏 , 卡 
© 屏 , -1> < 信号 ,不 好 , -1> 
< 人 ,多 ,1 > < 款式 ,新 颖 ,L > < 味道 ,不 错 ,1 > «ff 


F 5645990 果然 是 网 红 店 ,很 多 人 ,款式 很 新 颖 ,味道 也 不 错 ,价格 偏 贵 ,装修 有 特色 ,值得 


一 来 


4315497455 
x 


毕 德 察 ,粤语 的 意思 :好 的 不 得 了 。 网 红茶 点 ,点 都 德 的 精致 版 ,茶点 中 的 : 爱 


格 , 贵 , -1> 


< 味道 ,一 流 ,1 > < 环境 ,一 流 ,1 > 


Ca 代表 正 向 情感 , -1 代表 负 向 情感 
^ 实验 与 结果 分 析 
Aj lel 评测 方法 

二 算法 性 能 评测 采用 经 典 的 精准 度 P, 回 召 率 R 和 
FI 人 为 对 算法 进行 有 效 评价 ,本 研究 采用 了 多 分 类 指 
标 主 算 , 即 分 别 计算 正 / 负 向 情感 的 识别 精准 度 和 回 召 
率 (然后 求 两 类 情感 识别 的 指标 宏 平 均 和 微 平均 。 指 
标 计算 如 表 4 和 公式 (3) - (5) 所 示 : 

表 4 正 / 负 向 情感 判别 混淆 和 矩阵 


算法 判定 正 / 算法 判定 非 正 / 
负 向 情感 负 向 情感 
人 工 判定 正 / 负 向 情感 TP Ta Mares 
人 工 判定 非 正 / 负 向 情感 FNy/FN, TN/TN, 


正 / 负 向 情感 识别 的 评测 指标 分 别 表示 为 : 


ppo pa 
TP, + FP TP, + FN 
Flpc- To A (3) 
Biss TP. S TP. 
^ TP, * FP, ^ TP, * FN, 
pl a2 Pat, T 
P, €R, 


指标 的 宏 平 均 为 正 负 情感 的 评测 指标 的 均值 , 精 
准 度 , 回 召 率 和 FL 值 分 别 表示 为 Pj, Row Fl naro» 
微 平均 指标 计算 公式 如 下 : 

TP, + TP, 


Pus = TP, +TP, + FP, + FP, 
TP, +TP 
heus ,+ 7P, 
miao TP + TP, + FN, + FN, 
Fl 2 * Pus * Rus (5 
EE com 


4.3.2 实验 与 结果 分 析 

算法 实现 采用 Python 语言 ,主要 进行 了 两 个 实验 。 

(1) 实 验 一 :语料库 均衡 性 对 算法 的 性 能 影响 实 
验 。 实 验 根据 评论 人 对 产品 的 星 级 评价 ,将 评论 分 为 
好 评 与 差 评 。 好 评 以 正 向 的 “特征 - 情感 "表达 为 
主 ; 差 评 则 包含 较 多 的 负 向 “特征 - 情感 "对 。 预 实 
验 发 现 , 语 料 库 中 好 评 与 差 评 的 分 布 对 算法 性 能 
较 大 影响 。 为 从 语 料 质 量 层面 对 算法 的 实际 效用 进 
行 检验 ,实验 设 定 了 语 料 均衡 参数 K( 见 公式 6), 并 
将 天 作为 优化 因子 ,探测 天 的 不 同 取 值 对 算法 产生 
的 作用 。 语 料 数量 说 明 见 表 5 ,实验 结果 见 表 6 和 
表 7。 
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| Pos. review | ! ; 结果 显示 , 当 语 料 分 布 均衡 时 (K = 1:1) ,算法 表 
= Wi Pos. review C Corpus Neg review IN E i P 
岗 最 好 。 京 东 语 料 上 Fl, 20.878, Fl, 20.907; 
C Corpus (6) | 大 众 点 评语 料 上 FL, 20.827, FL,,, =0. 832; 随 着 
So ONS CHO. | 语 料 分 布 偏 斜 ,性 能 指标 下 降 。 分 析 原因 ,互信 息 计算 
eam , GORDUURUROGEN RISE 基于 词 共 现 ,情感 倾向 相同 的 词 项 频繁 共 现 ; 若 “ 特 征 
K 好评 评论 量 。 差 评 评论 量 。 好 评 评论 量 。 差 评 评论 量 情感 "对 没有 在 共 现 窗口 内 与 情感 确定 的 词 项 建立 
1:9 3 007 22 708 13 169 108 919 人 n NOM RM 
ass Qo ed icum isdi 关系 ,“ 特 征 -情感 ”的 极 性 无 法 判断 ”特征 -情感 
ii Bids "— ioios 10801 的 情感 状态 依据 邻近 情感 词 极 性 进行 推断 , 若 支持 共 
3:1 30 726 22 708 101 905 31 875 现 率 计 算 的 语 料 不 充分 ,可 导致 判断 失误 。 实验 中 , Ui 
91 —— 375 3540 — 10195 — — 12057 面 语 料 偏 少 的 情况 下 (K =9:1) ,支持 负面 情感 计算 的 
36 语 料 均衡 实验 结果 ( 大众 点 评 网 餐饮 评论 语 料 ) (单位 :条 ) 
正 向 特征 -情感 负 向 特征 -情感 宏 平均 向 平均 
Pp Rp Pn Rn P B ond r a Pe Ps Rss Fl. 
1:9 0. 795 0. 838 0.791 0. 669 0. 793 0. 753 0. 773 0. 794 0. 765 0. 779 
1:3 0. 843 0.891 0. 897 0.682 0.87 0. 786 0. 826 0. 862 0.8 0. 83 
1:1 0. 851 0. 881 0. 882 0. 702 0. 866 0.791 0. 827 0. 862 0. 803 0. 832 
3:1 0.714 0. 809 0. 702 0. 554 0. 708 0. 682 0.695 0.71 0.699 0. 704 
9:1 0. 708 0. 802 0.689 0.551 0. 699 0.677 0.687 0. 702 0.694 0.698 
R7 语 料 均衡 实验 结果 (京东 商城 电子 产品 评论 语 料 ) (单位 :条 ) 
: 正 向 特征 -情感 负 向 特征 -情感 宏 平均 微 平均 
Pp Rp Pn Rn MER R paco lucro nibo vera Fl 
1:9 0.9 0. 923 0.781 0. 699 0.841 0.811 0. 825 0.871 0. 862 0. 867 
1:3 0.913 0. 943 0. 835 0. 705 0.874 0. 824 0. 849 0. 895 0.879 0. 887 
1:1 0.93 0.947 0.872 0.765 0.901 0. 856 0. 878 0.916 0. 898 0. 907 
3:1 0. 887 0.915 0.752 0.672 0.819 0. 794 0. 806 0.854 0. 849 0. 852 
9:1 0. 876 0. 889 0.691 0.652 0. 784 0. 771 0.777 0. 829 0. 825 0.827 


KIRARAK E, T TT HAE - 情感 ” 


的 识别 精准 度 


EA 
A 


MERMA T SEM, mS AS SE E P_n =0. 691, 
Rs 0. 652; 大 众 点 评 数据 集 上 P_n 20.689, R_n = 
0. 551 ,综合 指标 也 最 低 , 京 东 数 据 F1,,,, 20. 777, 
F1 =0.827 ;大 众 点 评 数 据 Fl, 20.687, Fl. = 


0.698。 可 见 , 语 料 的 均衡 性 对 点 互信 息 算法 性 能 有 显 
车 的 影响 。 基 于 本 实验 结果 ,后 续 实验 取 K=1:1, 即 


在 均衡 语 料 下 进行 分 析 检 验 。 

(2) 实 验 二 : 基于 点 互信 息 的 “特征 -情感 "对 的 
情感 极 性 判断 实验 。 分 别 在 餐饮 和 数码 产品 两 个 领域 
的 均衡 语 料 集 上 运行 改进 的 SO_PMI, 利 用 评测 语 料 集 


对 算法 识别 效果 进行 检验 ,参照 人 工 标 注 , 计 算 精 确 


率 \ 召 回 率 和 有 所 , 优 化 算法 性 能 ,同时 与 词典 匹配 法 及 


标准 的 SO. PMI 算法 进行 对 比 。 结 果 如 图 2 Bron: 
微 平均 综合 指标 
算法 
| 词典 匹 
1.000 1.000 nA E m 
加 优化 SO PMI 
.800| .800 
.600| in 
400| on 
.200| .200 
.000| .000 
精准 度 回 召 率 FL(E 


算法 
1.000 1.000 “词典 匹配 
标准 SO-PMI 
加 优化 SO_PMI 
.800 800 
.600 600 
400 400 
200 200 
.000 000 
精准 度 回 召 率 Fl1 值 
评测 指标 
图 2 


评测 指标 


算法 性 能 比较 (京东 数码 产品 评论 ) 
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据 图 2 ,在 京东 评论 语 料 上 ,改进 算法 的 FL, = 
0.878; F1,,,, 20.907 ,三 个 算法 中 改进 算法 的 回 吾 率 尺 
和 FI 最 高 。 词 典 匹 配 法 虽然 有 最 高 的 准确 率 (P,,， 
=0.946,P,,,, =0.975), 但 召回 率 低 (Rua =0. 307, 
Rs =0.350)。 显 然 ,词典 对 未 涵盖 情感 词 的 极 性 无 


法 判断 。 标 准 的 点 互信 息 法 较 之 词典 法 ,准确 率 略 降 
宏 平均 综合 指标 "A 
词典 匹 

1.000 1.000 S MI 

本 优化 SO_PMI 
.800 .800 
.600 .600 
.400 .400 
.200 .200 
1000 一 一 一 - J .000 

精准 度 回 召 率 F1 值 


评测 指标 


(Ps = 0. 869, P,,,, =0.839), 但 回 召 率 显著 提升 
(R paro 70. 710, R,,,, 20.835) ,表明 点 互信 息 算法 具有 
较 强 的 发 现 情感 词 的 能 力 。 而 优化 了 的 点 互信 息 算法 
的 准确 率 和 回 召 率 均 再 次 提升 ,整体 表现 最 好 。 在 餐 


饮 评论 语 料 集 上 进行 实验 ,改进 算法 同样 表现 最 佳 ,如 
3 所 示 : 
微 平均 综合 指标 算法 
1.000 1.000 ”词典 匹配 
标准 SO-PMI 
加 优化 SO_PMI 
.800 .800 
.600 .600 
400 400 
200 .200 
.000 .000 
精准 度 回 召 率 Fi f£ 


评测 指标 


3 算法 性 能 比较 (大 众 点 评 餐饮 评论 语 料 ) 


分析 算法 提升 原因 ,主要 有 以 下 3 点 : 

十 (1 ) 借助 大 规模 均衡 语 料 研判 情感 表达 的 极 性 ， 
突破 了 词典 匹配 的 局 限 。 优 化 算法 的 分 析 对 象 定位 于 
“特征 -情感 "对 ,但 “情感 "并 不 限于 情感 词 项 ,而 是 
更 总 泛 的 富有 情感 色彩 的 表达 ,如 ”给 力 ”， 售 后 都 不 
4s a,“ 现 在 越 来 越 便宜 了 ”,“ 都 不 怎么 样 ” 等 这 些 不 
在 通 典 中 出 现 的 情感 表达 ,采用 优化 算法 均 可 以 推断 
其 情感 指向 ,从 而 能 显著 提升 回 召 率 。 

(2) 引 入 情感 转折 的 上 下 文 约束 提高 了 识别 精 
度 忆 优化 算法 比 标准 的 S0_PMI 算法 有 更 高 的 准确 
率 ( 原 因 在 于 标准 算法 面向 情感 词 ,依据 词 间 共 现 关系 
推测 词 项 极 性 ,并 不 考虑 特征 与 情感 词 间 的 依存 性 以 
及 上 下 文 “ 语 境 " 中 的 语义 转折 ,结果 必定 存 有 偏差 ， 
而 优化 算法 借助 依存 句法 分 析 进 行情 感 语义 的 转折 判 


断 ,能 够 更 准确 地 提炼 出 待 测 情感 表述 与 种 子 词 的 情 
感 共 现 关系 ,提升 识别 精度 。 例 如 “ 汤 味道 太 咸 ,但 青 
菜 好 吃 ”, 采 用 经 典 的 S0_PMI, 会 根据 与 “好 吃 ” 的 共 
现 关 系 推断 “味道 - 太 咸 "为 正 向 ,优化 算法 则 会 准确 
判断 出 “味道 — 太 成 "的 情感 极 性 为 负 向 。 

(3) 依 上 下 文 “ 语 境 " 准 确 识别 讲 贬 兼 具 的 情感 词 
极 性 能 提升 算法 综合 效能 。 自 然 语言 表达 中 ,中 性 词 
和 春 贬 兼 具 的 词 项 十 分 常见 , 易 使 情感 语义 产生 歧义 。 
如 常见 的 “大 ,小 ,高 , 低 ” 等 词 项 与 修饰 对 象 一 起 方 能 
传达 准确 的 情感 指向 。 本 研究 提出 的 算法 针对 “特征 
-情感 "对 展开 分 析 ,考虑 了 “情感 "对 ”特征 "的 依赖 
关系 , 借 由 大 规模 语 料 能 够 基于 上 下 文 约束 准确 辨识 
这 类 情感 表达 的 人 完 贬 含义。 以 下 以 “大 ”为 例 ,列举 京 
东 语 料 下 的 部 分 实验 结果 , 见 表 8。 


表 8 形容 词 “ 大 ”的 特征 情感 对 识别 结果 示例 


评论 中 特征 情感 情感 倾向 Wit ID 特征 情感 情感 倾向 
6064263 内 存 空间 大 1 6013538 屏幕 大 i 
6050609 风扇 声音 大 -1 6050603 声音 大 j 
6064324 K K -1 6064383 手机 大 1 
6064327 快递 压力 大 -1 6064276 体积 大 1 
5907129 铃声 大 1 6033014 效果 图 大 1 
6064411 Vr pepe Ta] R X -1 5907129 字体 大 1 
6028738 拍照 噪点 大 1 6064308 pro 强大 1 
6064399 电脑 非常 强大 1 6033023 风扇 噪声 有 点 大 -1 
5868634 电脑 的 质量 都 很 强大 1 6013511 运行 内 存 够 大 1 
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据 经 验 ,对 于 数码 产品 ,“ 大 ”在 评论 “内 存 空 
时 为 正 向 ;但 在 


间 » 


EAE" xU ye EET SEULS PA I6] “DERE 


大 ”, “电脑 的 质量 强大 ”为 正 向 评价 ;“ 面板 接 缝 间 际 
大 ” 则 判 为 负 向 。 表 8 示例 表明 ,算法 根据 修饰 对 象 给 


rre 


上 了 适 切 判断 。 但 结果 中 ,也 出 现 了 错 判 ,“ 拍 照 噪点 


大 "被 判断 为 正面 。 分 析 发 现 ， 拍 照 噪点 "在 语 料 集 
中 只 出 现 一 次 (“ 屏 幕 不 够 清楚 有 颗粒 感 ,光线 暗 一 


点 ,拍照 噪点 大 ,就 是 拍照 一 般 般 ,充电 口 有 点 松动 


fit 


一 下 会 有 断 充 问题 ,京东 快递 一 流 ”) , 因 出 现 的 语句 


中 “清楚 ”"“ 一 般 般 ”等 情感 导 引 词 未 纳入 种 子 记 
致使 "拍照 噪点 "与 正 向 词 “ 一 流 "最 接近 ,产生 错 


典 ， 
Hl. 


可 见 , 语 料 均衡 性 和 种 子 词典 的 完备 性 对 SO. PMI 改 
进 算法 的 表现 作用 较 大 。 但 总 体 来 看 ,对 近 20 万 均衡 
请 论语 料 进 行 分 析 , Fl 达到 近 0.9, 显 著 优 于 词典 匹 


法 和 标准 的 点 互信 息 算法 。 


5 结论 与 后 续 研究 思 


本 研究 基于 大 规模 领域 语 料 ,优化 点 互信 息 情 感 


读 竺 方法 ,以 实现 特征 级 情感 极 性 的 自动 研判 。 算 法 


IK" EHE - 情感 "对 与 情感 语义 明确 的 种 子 词 的 共 
汉 系 ,同时 考虑 语句 中 上 下 文 约束 导致 的 情感 转折 


WED, XR RE -情感 "的 极 性 进行 推断 。 真 实 


、 Al 


\ 
iB 


半 上 的 实验 结果 表明 ,本 研究 提出 的 SO_PMI 优化 


算 潍 ,性 能 上 优 于 基于 通用 词典 匹配 以 及 经 典 SO. PMI 
情感 极 性 识别 法 ,上 且 算 法 基于 大 规模 领域 语 料 ,不 受 词 


典 镜 束 ,可 适用 于 面向 领域 的 各 类 型 情感 分 析 任务 


o 


三 总 体 来 看 ,本 文 研究 贡献 可 归结 为 3 点 :中 将 分 


桥 对 象 设 定 为 “特征 - 情感 "对 ,一 定 程度 上 解决 词 项 


的 “情感 歧义 ”问题 。 


如 算法 可 根据 "大 ”的 修饰 对 


象 ,推断 “大 "在 句 中 的 情感 倾 徊 。 充 分 语 料 的 支持 


下 ,算法 可 解决 语 境 " 下 的 情感 分 析 问 题 。 凶 算法 优 
ij 提炼 词 项 间 共 现 关 


化 了 经 典 SO_PMI 3 E ETE 5] 
系 ,借助 句法 依存 关联 进行 情感 转折 分 析 , REER 


获 共 现 词 间 的 情感 一 致 性 ,提升 SO_PMI 的 识别 精度 


角 捕 


HE 
DX o 


(3 算法 为 基于 语 料 的 情感 词 极 性 研判 算法 。 实 验 揭示 


Fc 


则 ,无 需 过 多 人 工 干 预 , 无 训练 过 程 , 语 料 获 取 便 利 


8 语 料 充 分 、 正 负 情 感 语 料 分 布 均衡 是 算法 获得 最 佳 
性 能 的 重要 原因 。 且 算法 基于 统计 学 和 自然 语言 规 


,不 


受 词典 约束 ,这 些 都 使 算法 具有 较 强 的 普 适 性 和 迁移 


性 。 


需 特别 说 明 的 是 ,本 研究 选取 了 两 个 领域 进行 实 
验 ,在 两 个 领域 上 均 获 得 较 理 想 的 实验 结果 。 但 比较 
发 现 , 搜 索 类 产品 评论 (电子 产品 ) 语 料 集 上 的 表现 比 


体验 型 产品 (餐饮 类 ) 语 料 集 上 的 表现 略 好 。 是 否 是 
评论 语 料 特点 所 致 ? 这 一 问题 值得 关注 。 后 续 研 究 将 


拓宽 语 料 范畴 ,考虑 股评 .时评 .书评 等 领域 ,对 算法 应 


用 做 更 深入 的 探讨 。 
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Feature-opinion Polarity Identification Based on the Modified PMI Algorithm 
Nie Hui Shou Huanrong 
School of Information Management, Sun Yat-Sen University , Guangzhou 510275 

c Abstract: | Purpose/significance | By using corpus-based sentiment analysis, opinion word polarity can be pre- 

“dicted in accordance with its context. The method is significant in applications oriented to specific-domains sentiment 
alysis tasks since it can improve the prediction accuracy. | Method/ process | In the paper, context-oriented senti- 
ment polarity identification for emotion expressions was investigated. A Pointwise Mutual Information ( PMI) based al- 
gorithm was proposed to solve the problem. In terms of PMI, polarity of an emotion expression "feature -opinion" was 
inferred according to the co-occurrence of the expression with contextual opinion seed words. Furthermore, employing 
dependence relation analysis to detect sentimental reverse in context; with the modified PMI algorithm, we can pre- 
dict polarity of emotion expressions in a sentence more accurately. | Result/conclusion | The results indicate , com- 
pared with the Lexicon-based method and the classical PMI, the modified method performs better. With it, opinion- 
words unlisted in lexicons can be identified, and context-specific sentimental orientation of an expression can be de- 
tected precisely as well. Modifying the macro F1 value to 0. 827 and 0. 878 in cater-review corpus and electronic- 
product review corpus separately. The algorithm, supported by large-scale domain-specific corpus and based on sta- 
tistics and dependency analysis , is efficient due to convenience for data acquisition, which make it easier be applied 
in other domain-specific sentimental analysis tasks. 

domain-specific opinion word context 


Keywords: sentimental analysis pointwise mutual information 
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